A dictionary and a grammar of French compounds (Un dictionnaire et une grammaire de composés français) [in French]
نویسنده
چکیده
The paper introduces two resources for NLP, available with a GPL license: a dictionary of French compound words and a NooJ grammar which specifies a subset of compound patterns. Mots-clés : open source, ressources, dictionnaire, grammaire, mots composés
منابع مشابه
Élaboration d'un dictionnaire bilingue kanouri-français (Construction of the Kanuri-French bilingual dictionary) [in French]
Cet article présente la structure du dictionnaire kanouri-français de 6 000 entrées élaboré lors du projet SOUTÉBA puis informatisé lors du projet DiLAF. Il présente également la langue kanouri, ses locuteurs ainsi que la place de la langue dans les diférentes classifcations génétiques. Viennent ensuite une description de sa typologie et de son système verbal. L'article se termine par une descr...
متن کاملGLÀFF, a Large Versatile French Lexicon (GLÀFF, un Gros Lexique À tout Faire du Français) [in French]
RÉSUMÉ Cet article présente GLÀFF, un lexique du français à large couverture extrait du Wiktionnaire, le dictionnaire collaboratif en ligne. GLÀFF contient pour chaque entrée une description morphosyntaxique et une transcription phonémique. Il se distingue des autres lexiques existants principalement par sa taille, sa licence libre et la possibilité de le faire évoluer de façon constante. Nous ...
متن کاملOn the Effect of Head Tagging on Parsing Discontinuous Dependencies in French (Influence de l'étiquetage syntaxique des têtes sur l'analyse en dépendances discontinues du français) [in French]
RÉSUMÉ Dans cet article nous souhaitons mettre en évidence l’utilité d’un étiquetage syntaxique appliqué en amont d’une analyse syntaxique en dépendances. Les règles de la grammaire catégorielle de dépendances du français utilisées pour l’analyse gèrent les dépendances discontinues et les relations syntaxiques à longue distance. Une telle méthode d’analyse génère un nombre conséquent de structu...
متن کاملSemi-automated Extraction of a Wide-Coverage Type-Logical Grammar for French
The paper describes the development of a wide-coverage type-logical grammar for French, which has been extracted from the Paris 7 treebank and received a significant amount of manual verification and cleanup. The resulting treebank is evaluated using a supertagger and performs at a level comparable to the best supertagging results for English. Résumé. Cet article décrit le développement d’une g...
متن کاملA Methodology for semi-automatic structuring of a bilingual lexicographical corpus: the French-Kabyle case (Méthodologie pour la structuration semi-automatique du corpus dans une perspective de traitement automatique des langues : le cas du dictionnaire français-kabyle) [in French]
Résumé L’objectif de cette contribution est de proposer une méthodologie nouvelle de structuration de corpus à l’aide d’outils informatiques récents permettant aux linguistes non-spécialistes en informatique de constituer des corpus structurés en vue de leur exploration par des outils de traitement automatique des langues naturelles. Il s’agit, plus exactement, de présenter le processus d’infor...
متن کامل